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HE: 【 目的 】 为 移动 环境 下 数据 采集 与 分 析 提 供 一 种 基于 情境 感知 技术 (Context Awareness) 的 设计 框架 ， 以 优 
化 移动 数据 自动 化 采集 过 程 。[ 应 用 背景 ] 尽管 基于 移动 端的 情景 感知 数据 采集 较 之 传统 网 络 环境 下 的 人 工 与 半 
自动 方式 有 所 发 展 , 但 利用 移动 端 底层 传感器 直接 获取 实时 用 户 信息 ,实现 实时 、 动 态 、 全 面 的 数据 采集 与 挖掘 
进而 达到 主动 提供 服务 的 目的 ， 这 方面 的 应 用 仍 处 于 发 展 阶段 。[ 方法 ] 利用 Android 自 带 的 众多 传感器 , 设计 


了 客户 端 自 动 采 集 、 服 务 吉 主动 接收 的 数据 采集 框架 。 


在 实证 与 评价 方面 ,设计 了 一 个 通过 动态 情境 感知 推荐 


高 层 服务 的 实例 。[ 结果 ] 实证 结果 表明 :; 该 系统 能 够 针对 某 一 情境 采集 移动 用 户 数据 ,为 高 层 推荐 服务 提供 良 


好 支持 。[ 局 限 ] 采集 到 的 数据 具有 较 大 的 元 余 度 ,未 进行 多 角度 、 全 面 、 深 度 的 情境 推理 , 需要 在 以 后 的 研究 
中 针对 用 户 数 据 进 行 深 入 分 析 。[ 结论 】 基 于 情境 感知 的 移动 数据 自动 采集 系统 能 够 进行 移动 数据 的 主动 采集 , 并 
依据 采集 结果 对 个 体 或 群体 进行 推送 服务 , 对 移动 环境 下 用 户 行为 研究 与 情境 计算 研究 都 起 到 较 好 的 支撑 作用 。 


关键 词 : 情境 感知 ”应 用 框架 
分 类 号 : G25 TP311 


Android 


情境 推理 ”用 户 行为 


1 5l 


移动 通讯 技术 的 飞速 发 展 , 使 得 移动 智能 终端 使 
用 迅速 普及 。 手 机 缩短 了 人 与 人 沟通 的 距离 ,提升 了 
工作 效率 , 方便 了 社会 生活 。 一 方面 , 手机 的 普及 为 科 
研 工作 者 与 服务 提供 商 获 取 用 户 数据 提出 更 高 的 要 
求 ; 另 一 方面 , 手机 包含 大 量 真实 的 行为 数据 , 利用 
手机 数据 进行 情境 计算 以 及 相关 行为 研究 的 好 处 不 言 
而 喻 。 如 能 快速 获取 这 些 数据 ,挖掘 有 效 信息 , 感知 用 
户 所 处 环境 ， 从 而 推导 出 用 户 所 需 并 主动 向 其 提供 相 
应 的 服务 , 将 能 极 大 促进 行为 及 服务 研究 的 可 靠 性 与 准 
确 性 。 同 时 , 在 情境 计算 (Contextual Computing) 领 域 趾 
研究 者 根据 研究 需要 选择 使 用 多 种 情境 信息 , 并 利用 
物 联网 技术 、 云 计算 技术 、 后 台数 据 库 、 网 络 存储 以 
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及 传 感 需 技术 等 多 种 方式 监测 并 获取 这 些 环境 信息 ， 
将 这 些 通 常 是 数量 巨大 且 关 系 复杂 的 用 户 信息 规则 
化 。 规 则 化 过 程 具体 为 : 首先 建立 形式 化 模型 (静态 )， 
然后 对 静态 模型 设立 匹配 规则 , 动态 推导 出 用 户 需 求 
并 筛选 出 最 适合 的 用 户 服务 从 而 进行 服务 推荐 所 

以 上 是 情境 计算 的 一 般 过 程 。 从 整体 上 , 它 包 括 
数据 采集 及 规范 化 两 部 分 对 于 后 者 来 说 , 模型 的 选 
取 、 规 则 语言 及 中 间 件 的 研发 以 及 服务 的 匹配 等 ， 需 
要 找到 一 种 适用 于 特定 环境 及 情境 感知 系统 的 方法 体 
系 ,以 统一 已 有 的 数据 和 模型 而 对 于 前 者 , 获取 的 数 
据 的 质量 , 包括 精度 、 准 确 度 、 统 一 程度 ， 直接 影响 整 
个 情境 计算 的 后 续 过 程 。 然 而 , 移动 数据 的 采集 存在 
种 种 技术 瓶颈 与 安全 隐私 问题 ,使 得 大 量 基 于 移动 数 
据 采 集 的 研究 止步 于 理论 模型 。 由 此 ， 如 何 高 效 、 自 


通讯 作者 : 杨 金 庆 , ORCID: 0000-0002-2228-2462, E-mail: yjq@mails.ccnu.edu.cn。 
基于 多 维度 聚合 的 网 络 资源 知识 发 现 研究 ”( 项 目 编号 : 13&ZD183) RI ER ZE E 
户 群 体 行为 模拟 与 学 习 兴 趣 引导 研究 ”( 项 目 编号 : 71503097) 的 研究 成 果 之 一 。 


然 科 学 青年 基金 


动 地 采集 移动 情境 数据 ， 从 而 进一步 设计 一 种 良好 的 
情境 计算 框架 (包括 情境 模型 、 情 境 推理 、 感 知 服务 、 
中 间 件 技术 ), 使 系统 能 够 感知 用 户 状 态 、 提 升 用 户 体 
验 中 ,是 情境 计算 重点 关注 的 内 容 。 情 境 信息 获取 对 象 
类 型 多 样 , 所 对 应 的 获取 手段 也 很 多 。 对 于 空间 位 置 、 
上 时间、 网络、 蓝牙、 电量、 温度、 湿度、 光线 ,噪音 
等 物理 信息 一 般 通过 搭载 在 设备 上 的 物理 传感器 , 或 
者 通过 使 用 多 种 通信 协议 统一 设备 接口 获取 四。 对 于 
邻近 对 象 、 交 通 、 人 群 、 风 俗 、 景 物 等 高 级 情境 ， 则 
需要 通过 初级 情境 感知 组 合 来 推导 。 为 了 根据 传感器 
中 的 初级 情境 识别 出 高 级 情境 , 研究 者 通常 会 依据 研 
究 目 的 , 重点 关注 用 户 活动 中 的 一 些 任务 执行 场景 ， 
展开 调研 , 分 解 任务 , 计算 情境 。 另外 , 结合 数据 挖 气 
和 可 视 化 技术 发 现 情境 信息 间 的 隐 含 关系 , 并 将 其 可 
视 化 , 也 是 情境 感知 技术 的 发 展 方向 之 一 。 

Android 4.0 版 本 以 上 通用 智能 移动 终端 内 能 了 多 
种 传感器 , 传感器 能 够 采集 大 量 准 确 、 实 时 、 可 靠 的 数 
据 ， 从 而 使 得 利用 情境 感知 (Context Awareness) x KP! 
采集 终端 数据 成 为 可 能 。 根 据 普 适 计 算 四 和 移动 计算 
HET, 从 物理 传感器 采集 到 的 数据 能 够 转化 为 多 用 
户 、 多 任务 之 间 分 享 的 情境 信息 。 由 此 , 笔者 在 移动 
感知 软件 AWAREW 的 基础 上 开发 了 一 款 适 合 特 定 情 
境 分 析 的 情境 感知 系统 (简称 “MDCF”), 并 设计 了 一 
个 较 简 单 但 容易 扩展 的 情境 规范 化 框架 , 使 基于 此 系 
统 采集 到 的 数据 更 好 地 感知 情境 与 用 户 行 为 MDCF 
能 将 原始 信息 和 低层 情境 信息 抽象 处 理 成 普通 应 用 可 
以 理解 的 高 层 情境 信息 ,进而 提供 给 相关 应 用 。 大 致 
过 程 为 : 通过 手机 自 带 传感器 采集 原始 数据 ,然后 将 
数据 抽象 为 情境 信息 , 最 后 将 情境 信息 存储 在 SD F 
或 远程 传递 存 入 服务器 端 ,， 实现 移动 数据 的 采集 、 管 
理 、 利 用 与 研究 。 


2 相关 研究 


情境 计算 涉及 领域 广泛 , 呈现 系统 架构 层次 复杂 
化 、 技 术 多 样 化 的 特点 , 它 包 括 情境 数据 的 获取 ， 建立 
形式 化 模型 以 及 对 数据 进行 分 析 和 人 处理 。 自 Schilit 等 
1994 年 提出 情境 计算 的 概念 趾 以 来 , 诸多 学 者 利用 语 
义 网 、 物 联网 技术 、 本 体 理论 、 云 计算 技术 、 复 杂 风 
络 、SOA 等 众多 方法 研究 情景 感知 信息 。 仅 在 本 文 重 
点 研究 的 情境 数据 获取 技术 部 分 国内 外 学 者 已 有 相 


当 丰 富 的 研究 。 例 如 , 设备 信息 访问 (Device Information 
Access, DIA) 中 间 件 通过 统一 接口 实现 对 底层 异 构 数 
据 的 屏 藏 00, Xu 等 的 Cabot 组 件 致力 于 解决 动态 监测 
数据 的 一 致 性 问题 站。 韩 立 等 通过 问卷 、 录 屏 、 录 音 
等 综合 实验 方式 提取 用 户 体验 数据 [55， 另 外 , 在 一 些 
寺 定 领域 ,应 用 多 种 方式 采集 数据 进行 行业 服务 入。 
然而 , 情境 感知 系统 这 一 概念 一 直 没有 被 精确 定义 ， 
一 般 认 为 情境 感知 系统 使 用 情境 数据 提供 相关 信息 , 并 
且 为 用 户 提供 服务 , 它们 的 关联 则 取决 于 用 户 任务 505 。 
尽管 如 此 , 情境 感知 技术 仍然 得 到 工业 界 的 高 度 重视 ， 
并 取得 众多 应 用 成 果 。CORTEX059 融 合 移动 智能 手机 
传感器 数据 、 记 录 和 推理 情境 数据 的 移动 数据 采集 软 
件 。 它 使 用 事件 通信 协议 在 各 种 传感器 、 促 动 器 以 及 
应 用 程序 之 间 交 换 数 据 信息 , 采用 事件 -条 件 -行为 规 
则 推理 出 新 的 情境 信息 。Context Studio" "将 用 户 的 调 
解 作用 和 可 说 明 性 应 用 于 情境 推理 。 它 可 以 通过 用 户 输 
入 信息 来 控制 情境 数据 , 并 使 用 Blackboard 方法 将 多 
种 情境 结合 在 一 起 生成 新 的 高 层 情 境 。ContextPhone[ 
将 采集 的 信息 和 用 户 本 身 视 为 资源 , 根据 情境 用 户 的 
可 理解 性 , 理解 并 控制 情境 信息 交流 ,支持 应 用 程序 
和 用 户 间 的 交流 。AWARENESS09 重 视 用 户 隐私 问题 
并 应 用 环境 质量 概念 表达 情境 信息 质量 特征 , 通过 控 
制 共享 情境 信息 解决 用 户 的 隐私 问题 。Momentot hk 
过 多 种 通信 方式 采集 定性 、 定 量 数据 , 产生 多 种 类 型 
的 情境 信息 并 可 远程 控制 。MyExperiencet "采集 多 种 
传感器 和 基于 用 户 的 各 种 数据 。 它 支持 可 定制 的 、 基 
于 用 户 的 定性 数据 采集 以 及 随机 同步 上 传 数据 到 服 
务 器 端 , CenceMel” 通过 利用 移动 智能 手机 的 传感器 
和 社会 网 络 应 用 程序 分 享 的 信息 以 推断 个 体感 知 存 
在 状态 ,抽取 用 户 的 生活 模式 和 习惯 。 它 支持 对 具有 
异步 数据 挖掘 和 高 处 理 能 力 设备 进行 分 流 处 理 。 
EmotionSense 玉 感知 个 人 情感 、 行 为 活动 、 语 言 以 及 
朋友 间 近 距离 互动 ,支持 在 线 、 离 线 以 及 多 学 科 可 扩 
展 情境 信息 。 SystemSens 采集 用 户 与 应 用 软件 交互 
的 数据 与 信息 。 它 内 置 的 调试 功能 所 产生 的 信息 不 仅 
支持 本 软件 运行 还 用 于 情境 推理 和 数据 采集 。 
AWAREC 采集 各 种 传感器 数据 并 对 数据 进行 抽象 处 
理 生 成 高 层 情境 信息 并 实现 可 视 化 、 远 程 传递 存储 
等 。 相 较 于 同类 开源 系统 ，AWARE 的 优点 在 于 插件 
的 扩展 性 和 重用 性 。 
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3 ”需求 与 技术 思路 


当前 ,采集 移动 用 户 行为 数据 供 科学 研究 的 途径 
主要 可 概括 为 三 类 : 手动 采集 、 共 享 采集 和 主动 采集 。 
手动 采集 是 指 研究 人 员 根 据 实验 要 求 在 数据 拥有 方 的 
服务 器 中 直接 下 载 复制 或 索取 ; 共享 采集 是 指 通过 开 
放 和 平台 提供 的 接口 使 用 第 三 方 插件 获取 科研 所 需 数 
据 。 从 目前 笔者 收集 到 的 文献 所 采用 的 数据 来 看 , 通 
过 共享 采集 的 方式 获取 科研 所 需 的 数据 被 大 量 使 用 。 
但 是 这 种 方式 的 接口 开放 权 掌 握 在 运营 商 的 手中 ,对 
于 研究 者 来 说 ,在 获取 门槛 上 上 跨 费 周折 。 主 动 采 集 系 
统 是 指 人 研究 者 根据 实验 需要 自行 开发 数据 采集 软件 ， 
或 者 选择 符合 科研 需求 的 开源 软件 开发 组 件 进行 采 
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集 。 主 动 采集 方式 的 优点 在 于 数据 采集 的 自主 性 、 灵 
活性 。 但 是 仍 面临 采集 的 非 可 控 性 、 非 完整 性 、 不 可 
扩展 性 以 及 缺乏 可 视 化 等 问题 : 非 可 控 性 主要 是 指 采 
集 软 件 由 于 功能 的 兼容 问题 导致 不 能 有 选择 性 地 获取 
需要 的 科研 数据 ; 非 完 整 性 主要 是 指 系统 往往 会 采集 
不 到 科研 需求 所 规定 范围 的 数据 ， 导 致 数据 残缺 ; 不 
可 扩展 性 主要 是 指 采集 到 的 数据 由 于 接口 问题 不 能 满 
足 扩展 需要 。 

鉴于 以 上 问题 ， 笔 者 从 科研 数据 需求 出 发 ,将 手 
HLA Android 数据 共享 标准 技术 、 可 视 化 技术 、 数 
据 挖掘 及 机 器 学 习 技 术 相 结合 进行 系统 构建 。 系 统 目 
标 主要 包括 “传感器 数据 传输 “情境 规范 与 组 合 ”、 
“服务 发 现 ”。 实 现 的 技术 思路 如 图 1 所 示 。 
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图 1 基于 情境 感知 的 移动 数据 自动 采集 系统 总 体 技术 思路 


(1) 采集 层 功 能 : 传感器 数据 传输 .MDCF 通过 编 
程 操控 手机 内 的 传感器 数据 的 采集 与 远程 存储 , 利用 
getDefaultSensor() 方 法 实现 每 个 传感器 实例 化 ,并 在 
交互 界面 赋予 传感器 列表 中 的 每 个 传感器 启动 键 对 情 
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境 进行 选择 性 采集 。 

(2) 规范 层 初级 功能 : 基于 Android 数据 共享 标准 
获取 到 的 共享 数据 ， 针 对 研究 对 象 进行 情境 建 模 ， 首 
先 建立 元 数据 表示 模型 (本 体 )， 利 用 标准 本 体 规范 推 


理 本 体 间 、 元 组 间 的 关联 信息 ,获取 用 户 初级 (静态 ) 
情境 。 

(3) 规范 层 高 级 功能 : 从 静态 情境 利用 描述 逻辑 
进行 高 层 推理 , 针对 不 同情 境 ,推理 面向 服务 的 高 级 


(4) 服务 层 功能 : 对 高 级 情境 做 出 服务 , 并 将 反 
馈 输 入 MDCF,， 进 行进 一 步 的 服务 发 现 。 


4 关键 技术 实现 


4.1 系统 架构 

MDCF 系统 作为 情境 感知 系统 中 的 采集 部 分 , 其 
框架 仍然 采用 标准 C/S 体系 架构 。 主 要 包括 服务 器 、 
服务 器 端 数据 库 (MySQL)、 数 据 传输 方式 (MQTT)、 移 
动手 机 客户 端 (Android) 以 及 本 地 轻 量 级 数据 库 
(SQLite), MDCF 系统 结构 框架 如 图 2 所 示 。 
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图 2 移动 数据 采集 系统 架构 


MDCF 由 服务 器 端 和 客户 端 组 成 。 服 务 器 端 封 
装 服务 请 求 处 理 和 后 台数 据 库 (MySQL) 访 问 操作 ， 
将 本 地 数据 以 JSON 对 象 的 形式 , 经 过 HTTPS 协议 
传送 到 服务 器 。 通 过 使 用 MQTT 协议 实时 、 主 动 地 
向 客户 端 进行 情境 信息 交换 。 服 务 器 端 接 收 客户 端 
应 用 传送 过 来 的 数据 ,并 对 存储 在 服务 器 数据 库 中 
的 数据 进行 管理 , 为 科学 研究 提供 数据 支持 。 客 户 
端 通过 Android 开发 所 提供 的 各 种 类 (例如 : Sensor 
类 )， 对 移动 智能 手机 上 的 传感器 数据 进行 记录 、 收 
集 和 处 理 。 
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4.0 ”逻辑 架构 

MDCF 通过 将 移动 设备 产生 的 原始 数据 进行 存 
储 、 传 输 、 挖 气 、 抽 象形 成 初级 情境 信息 并 将 部 分 信 
息 可 视 化 。 因此 , MDCF 细 分 为 5 个 层 : 原始 数据 采集 
层 、 数 据 存储 层 、 数 据 交 流 层 、 上 下 文 屋 、 可 视 化 层 ， 
如 图 3 所 示 。 


可 视 化 层 插 
可 视 化 ” 自 适应 件 
上 下 文 层 
抽象 模型 分 类 
数据 交流 层 m 
协议 交流 格式 并 行 化 加 密 安全 T 
数据 存储 层 器 
挖掘 存储 集群 
原始 数据 采集 层 
便 件 传感器 ”软件 传感器 “基于 人 传感器 “社交 网 络 


图 3 移动 数据 采集 系统 层次 图 


(1) 原始 数据 层 : 是 指 从 手机 各 种 传感器 上 获 
取 的 第 一 个 存储 媒介 。 手 机 传感器 不 仅仅 包含 硬件 
传 感 硕 还 有 软件 传感器 、 基 于 用 户 的 传感器 。 本 系 
统 的 硬件 传感器 、 软 件 传感器 .行为 传感器 共 28 个 。 
HW 表示 由 手机 硬件 (如 陀螺 仪 ) 可 直接 获得 参数 的 
硬件 传感器 ; SW 表示 由 手机 软件 (如 APP) 信 息 共 享 
获得 信息 的 传感器 。H 表示 将 用 户 视 为 传感器 而 获 
得 的 行为 信息 (如 问卷 )， 它 无 法 由 硬件 或 软件 感应 
得 到 。MDCF 所 使 用 的 三 种 类 型 的 部 分 传感器 如 表 
1 所 示 。 

(2) 数据 存储 层 : 包括 本 地 存储 和 远程 存储 。 本 地 
存储 是 指 将 情境 数据 存储 在 手机 本 地 的 轻 量 级 数据 库 
SQLite 中 ; 远程 存储 是 指 经 Web 服务 上 传情 境 数据 至 
远程 服务 器 数据 库 中 。 

(3) 数据 交流 层 : 为 情境 信息 共享 提供 技术 支撑 ， 
并 为 本 地 和 外 部 的 情境 数据 的 交流 提供 交流 机 制 。 移 
动 数据 采集 系统 使 用 MQTT 技 术 支 撑 移 动 智能 手机 和 
服务 器 以 及 其 他 设备 之 间 的 情境 数据 交流 。MDCF 客 
户 端 内 部 使 用 Android 的 Broadcast 和 Observer 方 法 进 
行情 境 数 据 的 传输 。 

(4) 上 下 文 层 : 利用 简单 条 件 规则 将 原始 数据 抽 
象 为 初级 情境 信息 。 初 级 情境 信息 可 以 在 交流 层 进行 
TF, 并且 可 以 进一步 将 产生 的 静态 情境 信息 推理 生 
成 动态 情境 信息 。 
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表 1 部 分 传感器 列表 


传感器 > 描述 
HW SW H 

Accelerometer vV 表示 治 着 设备 轴 的 加 速度 力 包括 重力 
Application Y 用 于 记录 设备 上 的 前 台 和 后 台 运 行 的 应 用 名 称 
Barometer Y 表示 记录 大 和 气 气压 有 关 的 传感器 信息 
Battery Y 产生 电池 和 电源 事件 数据 (如 重启 、 关 闭 ) 
Bluetooth Y 内 置 的 蓝牙 传感器 产生 信息 和 执行 间隔 扫描 附近 的 蓝牙 设备 
Communication Y 用 于 用 户 的 通讯 活动 , 例如 通话 状态 、 信 息 状态 
ESM Y 通过 ESM 问卷 获取 用 户 提 供 的 数据 , ESM 是 由 情境 事件 、 时 间 等 触发 
Gravity Y 表示 沿 着 设备 轴 的 重力 有 关 的 传感器 信息 
Installations Y 用 于 记录 移动 设备 上 的 应 用 程序 添加 、 删 除 或 更 新 的 信息 
Light Y 用 于 感触 周围 环境 亮度 信息 
Locations Y Y 记录 移动 设备 的 网 络 和 GPS 位 置信 息 并 提供 最 可 靠 的 位 置信 息 
Network V 记录 使 用 网 络 情况 , 例如 移动 网 络 、WiFi 
Orientation Y 表示 沿 着 设备 轴 的 方位 角 有 关 的 传感器 信息 
Processor Y 记录 系统 、 用 户 和 移动 处 理 器 的 工作 负载 
Proximity Y 记录 设备 和 对 象 之 间 的 距离 
Screen V V 记录 屏幕 状态 以 及 用 户 的 锁定 和 释放 事件 


(5) 可 视 化 层 : 利用 上 下 文 插件 将 上 下 文 层 的 情 
境 信息 进行 简单 可 视 化 呈现 , 使 得 用 户 可 以 对 情境 信 
息 进 行 交互 。 其 具有 诸多 功能 , 例如 : 共享 选择 、 传 感 
器 列表 、 当 前 状态 等 。 
4.3 客户 端 实现 

(1) 传感器 控制 功能 

传感器 控制 功能 是 MDCF 的 关键 技术 。 传感器 控 
制 功能 的 实现 , 需要 根据 不 同 传感器 及 其 类 型 , 采取 
相 适 应 的 程序 设计 : 手机 自身 的 物理 传感器 采用 
Android 中 的 Sensor 类 通过 SensorManager 的 
getDefaultSensor(int TYPE) 方 法 获取 指定 类 型 的 传 感 
$8; 软件 传 感 右 利用 Android 数据 共享 标准 实现 不 同 
应 用 的 数据 交换 (根据 程序 细 化 ); 行为 传感器 通过 用 
户 与 系统 的 交互 , 输入 难以 测 录 的 数据 信息 ,例如 通 
过 MQTT 协议 进行 问卷 推送 ,提醒 用 户 填写 。 科 研 人 
员 可 以 根据 科研 需求 自主 地 启动 个 性 化 传感器 , 通过 
Android 的 PreferenceActivity 结合 PreferceFragment 实 
现 各 类 传感器 的 个 性 化 控制 界面 。 鉴 于 以 上 技术 , K 
现 各 类 传 感 需 实例 化 如 表 2 所 示 ( 其 中 参数 TYPE 用 于 
标识 不 同 的 传感器 , TYPE 数值 封装 在 Sensor 类 中 , -1 
表示 通用 类 型 的 传感器 )。 

(2) 插件 管理 功能 

MDCF 考虑 到 面向 科研 数据 采集 需求 的 多 样 性 ， 
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表 2 Sensor 类 


TYPE 参数 名 称 传感器 名 称 
1 TYPE ACCELEROMETER 加 速度 传感器 
4 TYPE GYROSCOPE FE RUE n 
5 TYPE LIGHT 光照 传感器 
2 TYPE MAGNETIC FIELD ”磁力 计 传感器 
3 TYPE ORIENTATION 方位 传感器 
6 TYPE PRESSURE 压力 传感器 
8 TYPE PROXIMITY 距离 传感器 
7 TYPE TEMPERATURE 温度 传感器 
9 TYPE APPLICATION 应 用 记录 传感器 

-1 TYPE ALL 所 有 传感器 


需要 降低 系统 的 耦合 性 ,开放 系统 软件 接口 ， 提 高 软 
件 应 用 的 可 扩展 性 。 借 助 插件 的 灵活 性 可 以 对 情境 信 
息 进 行 抽象 ， 继 而 将 机 器 学 习 、 数 据 挖掘 算法 等 技术 
融入 情境 推理 , 将 原始 数据 抽象 为 更 高 等 级 的 情境 
言 息 。 

(3) 可 视 化 功能 

客户 端 可 视 化 是 MDCF 主要 特色 之 一 ,区 别 于 其 
他 一 键 式 采集 软件 ， 可 以 提供 信息 采集 情况 反馈 ， 对 
数据 采集 的 整个 流程 起 到 一 定 的 监控 作用 。 这 不 仅 提 
高 了 用 户 体 验 , 还 保证 了 人 机 交互 的 信任 程度 。 使 用 
户 及 时 了 解 和 改善 发 送 策 略 ,调整 采集 范围 , 保证 科 
研 人 员 的 数据 规范 程度 与 用 户 的 隐私 安全 。 


44 服务 器 管理 端 实 现 

服务 器 端 主要 是 基于 Tomcat+MySQL 搭建 一 个 轻 
量 级 服务 , 主要 接收 客户 端 上 传 的 情境 数据 ， 能够 对 
所 收集 的 信息 进行 自主 管理 、 抽 象 分 析 等 。MDCF 服 
务 器 是 以 Web 和 MQTT 两 种 方式 结合 实现 情境 数据 
的 远程 存储 和 与 客户 端的 信息 交流 ,服务 器 端的 构成 
如 表 3 所 示 。 

表 3 服务 器 端 结构 层次 表 


数据 采集 系统 服务 器 
Web 服务 器 MQTT 服务 器 
Data MVC Messages Repository 
Databases Messages 


通过 Web 服务 器 和 MQTT 服务 器 , 可 以 在 客户 端 
进行 设置 实现 数据 远程 发 送 。MQTT 服务 器 支持 分 布 
式 基 础 设施 并 与 用 户 客户 端 进行 实时 情境 信息 交流 ， 
该 服务 器 是 一 种 RSMB 发 布 /订阅 代理 , 也 可 以 实现 集 
群 以 支持 情境 信息 的 负载 平衡 。 为 保证 安全 与 隐私 问 
ii, MQTT 中 的 RSMB 支持 安全 认证 连接 。 消 息 存储 
方式 是 基于 文件 或 基于 数据 库 的 ,主要 存储 情境 信 
息 、 事 件 和 数据 。Web 服务 遵循 MVC 设计 模式 ， 即 根 
据 请 求 、 控 制 器 加 载 相 应 对 象 模型 并 执行 命令 。 如 果 
请 求 可 视 化 ,控制 器 另外 加 载 相应 的 视图 。 因 此 ， 
MDCF 服务 包括 Web 服务 器 和 MQTT 服务 需 , 结合 了 
两 者 的 特性 , 提高 了 自身 的 性 能 。 

45 ”应 用 效果 


图 4 MDCF 客户 端 功 能 界面 


客户 端 启 动 后 首先 显示 界面 如 图 4(a) 所 示 。 它 展 
示 MDCF 含有 的 软件 和 硬件 传感器 选项 ， 还 显示 客 
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户 端 唯一 标识 符 等 信息 ， 其 中 唯一 标识 符 是 在 用 户 
安装 软件 时 产生 的 。 插 件 管理 功能 可 打开 添加 插件 界 
面 , 显示 MDCF 系统 兼容 的 数据 采集 和 可 视 化 的 搬 
件 ， 如 图 4(b) 所 示 。 原 始 情 境 状 态 可 视 化 界面 可 以 根 
据 启 动 的 传感器 和 插件 来 显示 更 多 的 情境 信息 ， 如 
图 4(c) 所 示 。 


5 基于 MDCF 的 情境 建 模 与 情境 推理 


51 情境 建 模 

情景 建 模 主要 是 利用 一 些 理论 模型 或 方法 ， 以 形 
式 化 的 方式 将 得 到 的 情境 表示 为 有 意义 的 线索 。 选 择 
何 种 形式 化 方法 来 表达 存储 情境 信息 ， 建立 情境 模型 ， 
是 情境 信息 获取 后 的 重要 工作 。 目 前 ， 比 较 经 典 的 形 
式 化 方法 有 着 色 Petri RIP, 面向 对 象 的 方法 以 及 本 
体 模 型 ei。 着 色 Petri 网 可 以 表达 的 情境 信息 有 限 , 仅 
适用 于 分 布 式 并 发 进程 。 面 向 对 象 模 型 具有 很 强 的 表 
达能 力 ,但 缺乏 规则 的 支持 上 。 而 以 本 体 论 为 理论 基础 
的 本 体 语 言 2 能 够 建立 知识 表示 和 推理 系统 BA 
辑 描 述 能 力 、 推 理 能 力 和 表达 能 力 , 能 够 很 好 地 描述 
情境 信息 ,进而 达到 采集 结果 形式 上 与 语义 推理 上 的 
统一 。 本 文选 择 基 于 本 体 的 情境 模型 对 采集 的 情境 数 
据 进 行 描述 。 

MDCF 系统 构造 本 体 的 目标 是 获得 两 个 层次 的 情 
境 , 面向 低层 和 面向 高 层 , 低层 的 情境 感知 建 模 是 任务 
推导 型 ， 即 利用 情境 模型 及 数据 逻辑 推理 出 用 户 当 前 
任务 (例如 ,利用 用 户 在 用 何 种 APP 判断 出 用 户 在 做 
何 种 事情 ); 高 层 的 情境 感知 建 模 更 加 面向 服务 需求 ， 
即 通 过 挖掘 本 体 之 间 以 及 本 体 的 元 组 之 间 的 关联 ， 
对 每 种 关联 进行 算法 推理 ,进而 推理 出 用 户 的 情境 
需求 (例如 : 通过 检查 APP 出 错 率 、 设 备 温差 、 用 户 
使 用 频率 , 推断 出 何 种 品牌 手机 更 容易 因 电 池 问 题 
而 影响 消费 )。 

初步 设 定 一 个 含有 9 元 组 描述 <Location、Device、 
Temperature 、Battery、App-Foreground、App-History、 
App-Notification 、App-Crash 、WIFI> 的 情境 信息 本 体 
(APP 使 用 本 体 ), 以 及 其 内 部 元 组 的 关联 关系 的 本 体 
模型 。 如 表 4 Br, 每 个 元 组 包含 一 系列 传感器 记录 
(有 的 记录 名 称 重复 , 但 并 不 表示 可 以 表示 别 的 元 组 ， 
因为 它们 来 自 于 不 同 传感器 )。 
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表 4  MDCF 情境 建 模 部 分 元 组 及 记录 列表 


元 组 记录 记录 解释 
device id 设备 ID 
Location timestamp 记录 时 的 时 间 戳 
地 理 空间 latitude 用 户 所 处 的 纬度 
Location=<device_id,timestamp,latitude,longitude,accuracy> longitude 用 户 所 处 的 经 度 
accuracy 位 置 的 误差 值 
device id 设备 ID 
Devi — 
手机 品牌 ee timestamp 记录 时 的 时 间 截 
ERIT ES FAIK 3 " 
fii . E hardware 移动 设备 代码 
件 Device-«device id,timestamp,hardware,product^ 
product 移动 设备 名 称 及 型 号 
r 
器 device id 设备 ID 
H 
列 Bici timestamp 记录 时 的 时 间 戳 
六 E wn yA HE 
= F Ned tempOut 设备 外 部 环境 温度 
pu pe Temperature=<device id,timestamp,tempOut, accuracy> E 
S add a accuracy 外 部 温度 的 误差 
| 一 
CN device id 设备 ID 
le» E Paten timestamp je 3 IE BIS ESTE [8] RR 
= 手机 电池 温度 x " 
Sm or eut tempIn 手机 内 部 温度 (电池 温度 ) 
a» Battery =<device id,timestamp,templIn, battery level^ E 
"a battery_level 电池 温度 的 合理 范围 
device id 设备 ID 
i uo WIFI : 3 — 
x Bm timestamp Te REESE RIS IST Te] ER 
iFi 
| id 当前 连接 的 网 络 接口 名 称 
WIFI= 一 device id, timestamp, ssid, frequency — d 当前 p BH zl ^ 
frequency WiFi 宽带 频率 
device id 设备 ID 
eb es timestamp 记录 时 的 时 间 截 
END 
app name 正在 运行 的 APP 应 用 
App-Foreground-«device id,timestamp,app name,Is sys app 
Is sys app 判断 是 否 系统 自 带 APP 
device id 设备 ID 
ji T nanc $ timestamp WERT HY HIST TEJ RR 
F T 
传 app_name 使 用 过 的 所 有 APP 应 用 名 称 
R App-History=< device id, timestamp,app_name, end time > ] 
器 end time APP 应 用 使 用 终止 的 时 间 
D 
F) device id 设备 ID 
^ App-Notificati s €T 
"i ARE ur timestamp 记录 时 的 时 间 戳 
POLARI Veios SE E 
zd "- pos app name 被 发 送 通 知 消息 的 所 有 APP 名 称 
App-Notification- — device id, timestamp,app name, text> B 
text 通知 消息 的 标题 内 容 
device id 设备 ID 
App- h ; s V 
手机 E kie m timestamp 记录 时 的 时 间 戳 
示人 包 应 用 运 介 二 二 wx bH h 
ME TO app name 运行 错误 的 所 有 APP 应 用 名 称 
App-Crash= 一 device id, timestamp,app name, error . 
error 记录 错误 类 型 


在 建立 本 体 模型 之 后 , 可 以 从 中 挖 气 元 组 与 元 组 。 知 发 布 信息 推理 用 户 受 信息 干扰 状态 (nfluence); 根据 
之 间 的 关联 ， 从 关联 推导 出 满足 上 文 所 指 的 高 层 情境 手机 内 外 部 温差 品牌 以 及 使 用 APP 信息 (Temperature) 
感知 信息 。 如 图 5 所 示 , 在 使 用 手机 行为 过 程 中 , 可 以 ” 推理 不 同 品牌 用 户 使 用 APP 的 体验 信息 ; 根据 APP 出 
根据 APP 使 用 规律 推理 其 生活 规律 (Life), 根据 手机 通 。 错 率 与 使 用 APP 信息 推理 用 户 对 APP 的 接受 程度 。 
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Locations Device Temperature Battery 
zee Asocion device id — device id device id — — 4 device id — | 
| latitude timestamp timestamp E | timestamp j 
once 
P longitude | hardware temperature EZ battery level | 硬 
T Relation accuracy | product accuracy | temperature | 件 
s [= fi 
| Ho emm | f 
| 


| 
UTE l cca eoe ol device id — um E 
timestamp timestamp timestamp timestamp timestamp | "^ 
application _ ife | epplication | aplicacion. | application | m 
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图 5 “APP 使 用 "本 体 模 型 (元 组 及 元 组 之 间 关 系 ， 中 层 情境 ) 
5.0 ”情境 推理 关系 和 规则 定义 成 本 体 、 本 体 属性 (元 组 ) 和 约束 关系 ， 
通过 直接 情境 采集 到 数据 并 通过 形式 化 方法 建立 。 其 典型 代表 OWLB3 通 过 执行 SWRL 规则 来 对 模型 信 
情境 模型 ,属于 情境 计算 的 先 验 环节 ， 其 难点 在 于 对 。” 息 进行 扩充 , 适用 于 中 高 层 情境 的 推理 。SWRLG9 规 
数据 格式 的 统一 处 理 模 型 的 选择 中 ,然而 ,直接 情境 并 ”” 则 表示 如 下 : 
不 能 描述 用 户 当前 的 完整 情境 , 需要 利用 推理 规则 NETTEN 
HHERHURRCE FERME MR d 其 语义 是 :只 要 前 件 中 所 表示 的 条 件 在 模型 中 被 
信息 ”1。 人 情境 推理 的 方法 很 多 ,包括 : 基于 相似 度 的 满足 ， 则 后 件 中 描述 的 事实 也 必须 在 模型 中 存在 ， 如 
计算 推理 中 、 基 于 多 值 钠 辑 的 推理 四、 基于 规则 的 推 。 果 后 件 中 的 事实 模型 不 存在 , 推理 引擎 则 会 将 其 添加 
理 ” 、 基 于 本 体 的 推理 、 基 于 本 体 和 自 定义 规则 的 情 。 到 模型 中 。 本 文 在 实证 中 基于 “APP 使 用 ”本 体 中 的 若 


境 推理 上 。 其 中 ,基于 本 体 和 自 定义 规则 的 情境 推 
是 利用 自 定义 的 描述 逻辑 与 本 体 模 型 ,将 情境 与 情境 


i 


i 


干 元 组 关联 (中 层 情 境 ) 进 行情 境 扒 


情境 信息 ， 如 表 5 所 示 。 


E 理 ， 可 以 得 到 高 层 


表 5 “APP 使 用 本 体 ”* 中 当前 情境 向 高 层 情境 推理 规则 列表 
关联 (中 层 情境 ) 推理 适用 算法 高 层 情境 
Life 生活 型 情境 K-means, SOM, FCM:- 表示 App-History 中 存在 某 种 生活 规律 


Influence 影响 型 情境 
Experience 体验 型 情境 


Mental 心理 型 情境 


SVD, NSFCM, VSM-- 
Apriori, FP Growth, Eclat::- 


Apriori, FP Growth, Eclat::- 


表示 App-Notification 中 通知 信息 


的 干扰 性 


表示 Device, Location, tempIn-temp 间 存 在 的 相关 关系 


表示 App-Crash 与 App-History, Device 间 


存在 的 相关 关系 


由 表 5 可 知 ， 通过 设备 信息 


Device) 与 应 用 出 错 率 


(App-Crash) 的 关系 ,可 以 判断 用 户 当 前 手机 状态 为 
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C hinaAX IVmT1FARHT! 


EL ANN 


“ 卡 顿 ” 建议 尽快 升级 软件 版 本 或 更 换 手 机 。 
推理 规则 1 基于 用 户 某 APP 使 用 规律 的 推理 规则 : 
<timestamp,end_timestamp|Life> € App-History 
K-means, SOM, FCM:: 应 用 使 用 行为 
从 App-History 元 组 中 某 APP 的 开始 时 间 和 终止 
时 间 ,， 利 用 合适 的 聚 类 算法 ， 从 当前 使 用 情境 推理 使 
用 规律 。 
推理 规则 2 基于 用 户 获 得 通知 信息 的 干扰 性 的 推 
理 规则 : 


«app name, text|Influence> € App-Notification 
SVD, NSFCM, VSM--- 干扰 信息 


从 App-Notification 元 组 中 的 通知 信息 ,利用 相关 
文本 挖 气 算法 , 提取 关键 字 ， 以 此 判断 通知 信息 的 类 
型 (干扰 /不 干扰 )。 从 当前 情境 推理 是 否 可 以 智能 化 地 
进行 干扰 消息 拦截 。 

推理 规则 3 基于 手机 在 不 同时 间 下 温差 的 推理 规则 : 


<temperature, app_name|Experience> € Device, Battery 


Apriori, Eclat, FP Growth… E 
E 用 户 体验 


从 相关 域 中 的 情境 信息 , 利用 相关 关联 算法 推理 
手机 温度 与 用 户 体验 间 的 隐 含 关系 。 

推理 规则 4 基于 手机 在 不 同时 间 下 温差 、 使 用 情 
况 与 出 错 率 的 推理 规则 : 

«app name, temperature, timestamp| Mental> € Device, App- 
Fossa cius Apriori. Echt. FP Growth- 用 户 心理 

从 相关 域 中 的 情境 信息 , 利用 关联 算法 推理 用 户 
心理 信息 。 


6 应 用 实例 


为 验证 MDCF 采 集 系 统 及 对 应 情境 推理 框架 的 适 
用 性 , 从 2016 年 9 月 15 日 到 2016 年 11 月 15 日 , 采 
集 28 份 有 效 个 人 数据 (实际 采集 30 份 )。 学 习 类 APP 
记录 一 共 104 052 条 , 描述 了 18 个 APP 使 用 信息 ,其 
中 ,从 前 文 定义 的 “APP 使 用 ”本 体 的 不 同 元 组 中 抽取 
有 关 用 户 任务 的 简单 列表 ,如 表 6 所 示 。 


表 6 静态 情境 例子 


Device id 时 间 经 度 纬度 电量 任务 
a32f534c4a 2016-09-09 15:01:18 30.521051 114.357306 45 faa qu] d 
a32f534c4a 2016-09-09 15:18:00 30.521051 114.357306 45 有 道 诉 
a32f534c4a 2016-09-09 15:19:45 30.521051 114.357306 44 AK jy 
a32f534c4a 2016-09-09 16:02:18 30.521051 114.357306 30 有 道 词 4 
a32f534c4a 2016-09-09 16:28:22 30.521051 114.357306 30 有 道 诉 


依据 之 前 建立 的 本 体 模型 ， 将 数据 从 离散 的 原始 
数据 输入 本 体 , 提取 关联 并 进行 情境 组 合 : 唯一 标识 、 
时 间 、 地 点 、 电 量 、 任 务 , 处 理 得 出 静态 情境 信息 。 
如 表 6 所 示 , 该 用 户 在 某 一 时 段 在 同一 地 点 ( 某 教学 楼 
内 ) 使 用 “有 道 词典 *APP。 接 着 , 将 处 于 不 同 元 组 中 的 
APP 相关 信息 提取 出 来 , 提取 字段 如 表 7 所 示 。 
表 7 数据 集 格式 说 明 


列 LEA 说 明 

1 NA fT ID 

- Ghedudhi 设备 ID, 同一 手机 内 的 不 同 APP 应 用 使 用 
ID 来 关联 


对 应 不 同 用 户 不 同 的 APP， 由 “<app 分 类 名 
称 >.<app 名 称 >” 组 成 
4 timestamp 不 同 用 户 使 用 和 终止 APP 时 间 


3 APP name 


EN 数据 分 析 与 知识 发 现 


应 用 情境 推理 规则 1, 使 用 简单 聚 类 算法 求 得 某 
APP 与 其 他 APP 间 的 相关 关系 , 用 于 协同 推荐 服务 。 
例如 , 设 定 7 类 APP: 系统 管理 类 , 社会 交流 类 , 学 习 
工具 类 , 网 络 购物 、 支 付 类 , 检索 工具 类 , 休闲 娱乐 类 ， 
实用 工具 类 。 图 6 显示 这 7 类 APP 根据 用 户 使 用 频率 
相关 性 推导 出 的 关联 程度 ,其 中 节点 代表 APP、 颜 色 
代表 APP 类 型 , An 代表 聚 类 结果 。 

从 图 6 可 以 发 现 ,A2 和 A3 内 部 相关 程度 较 高 。 
A2 中 的 APP 数量 较 少 , 但 是 在 使 用 91( 掌 上 阅读 ) 
和 51( 咪 咕 阅 读 ) 学 习 工 具 的 同时 ,用 户 还 倾向 于 使 
用 记事 本 工具 。 即 可 根据 此 动态 情境 ， 在 用 户 下 载 
或 使 用 阅读 类 APP 时 ,进行 记事 本 APP 的 主动 服 
务 推荐 。 
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= Entertainment Leisure ^ General Utility 


- Search Tools 


= Social Communication 


- Learning Tools Net Shopping Paying 


= System Magement 


图 6 动态 情境 推理 结果 示例 : 根据 用 户 使 用 频率 相关 性 推导 出 7 类 APP 的 聚 类 


7 结 i& 


本 文 基于 手机 传感器 与 AWARE 体系 结构 , 设计 
了 一 个 移动 数据 采集 、 推 理 、 分 析 框 架 。 针 对 APP 使 
用 情况 与 自 定义 推理 规则 ,进一步 对 所 获 数据 进行 5 
态 情境 推理 , 得 到 用 户 规 律 并 针对 规律 进行 主动 服 
务 。 实 证 表明 , 基于 情境 感知 技术 的 移动 数据 采集 能 
够 实现 基于 数据 的 规范 、 推 理 与 服务 发 现 。 这 对 数据 
采集 的 研究 者 来 说 , 无 疑 是 有 支撑 作用 。 结 合 国 内 移 
动 数据 采集 的 特殊 环境 进行 移动 采集 系统 的 本 地 化 、 
个 性 化 , 建立 完整 的 情境 推理 系统 ， 是 今后 需要 努力 
的 方向 。 

值得 一 提 的 是 , MDCF 所 采集 的 数据 适用 于 从 情 
境 原始 数据 到 低层 静态 情境 再 到 高 层 动态 情境 的 有 限 
推理 ,然而 , 这 并 不 是 情境 感知 的 目的 , 情境 感知 的 最 
终 目的 是 优化 服务 。 服 务 的 种 类 多 样 , 因此 ,可 在 此 基 
础 上 , 针对 不 同情 境 , 发 展 多 类 服务 体系 。 此外, 运用 


中 间 件 技术 和 相关 关系 算法 进行 高 维度 高 层 情境 推理 
与 行为 发 现 ,是 情境 计算 领域 未 来 的 重要 发 展 方向 。 
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Collecting Mobile Data Based on Content Awareness 
— —An Empirical Study 


Xia Lixin Yang Jinqing Cheng Xiufeng 
(School of Information Management, Central China Normal University, Wuhan 430079, China) 


Abstract: [Objective] This paper proposes the framework for a mobile data retrieval and analysis system based on 
context-awareness, aiming to optimize the related data mining procedures. [Context] Nowadays, the automatic dynamic 
and comprehensive applications for mobile data mining were still being developed. [Methods] First, we proposed a 
framework to collect mobile data from the client side with the help of Android AWARE sensor. The collected data was 
received by the server automatically. Then, we designed an empirical study to analyze the retrieved APP usage data. 
[Results] The proposed system could effectively recommand useful APPs to the mobile users. [Limitations] More 
in-depth analysis was needed to examine the collected data. [Conclusions] The proposed framework could help us 
effectly retrieve and analyze mobile useage data, which benefits the contextual computing research and the mobile 
informaiton behavior studies. 
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